go_bunzee

딥시크, 저비용 모델 개발 비결 공개...새로운 사실은... | 매거진에 참여하세요

questTypeString.01quest1SubTypeString.00
publish_date : 25.05.20

딥시크, 저비용 모델 개발 비결 공개...새로운 사실은...

#중국 #딥시크 #오픈소스 #딥시크-V3 #연구 논문 #H800 #수출 규제 #구조 최적화 #MoE #R1

content_guide

딥시크가 지난해 12월 경쟁사보다 훨씬 낮은 비용으로 'V3' 모델을 개발한 과정을 논문으로 공개했다. 량원펑 딥시크 창립자도 논문 작성에 참여했지만, 대부분 내용은 이미 알려진 것이다.딥시크는 14일(현지시간) '딥시크-V3에 대한 통찰: 확장성 도전과 AI 아키텍처를 위한 하드웨어에 대한 고찰'이라는 제목의 논문을 온라인 아카이브에 게재했다. 딥시크-V3가 2048개의 엔비디아 'H800' GPU에서 훈련됐으며, 이 성과의 핵심은 '하드웨어-소프트웨어 공동 설계' 전략 때문이라고 밝혔다. H800은 미국 수출 규제에 맞춰 중국

출처 : https://www.aitimes.com/news/articleView.html?idxno=170522